短短兩年,人類與人工智能的距離愈來愈近。一方面,企業擁抱生成式AI,仍摸索商業模式;另一方面,種種副作用如AI騙案已湧現,未見其利先見其害。研發AI要大量人力財力,耗電量更不容小覷。去年,全球28國簽署《布萊切利宣言》確保AI安全,惟大型科企如何部署AI,才真正左右人類命運。
撰文:郭顯通 本刊記者
「七國咁亂」──當今人工智能(AI)發展的最佳寫照﹝圖一﹞。2024年5月,這場AI大戰的「始作俑者」OpenAI在YouTube直播發表新模型GPT-4o,可謂「人味」滿滿:可以辨識用家的熒幕畫面,判斷其情緒後答覆,甚至連聲音都有抑揚頓挫,AI開發人員Benjamin De Kraker(現職xAI,有份訓練旗艦產品Grok)直呼:「這已是AGI(通用人工智能)了!」OpenAI發表GPT-4o的翌日便是一年一度的Google I/O開發者大會(通常會發表新技術或產品),有指OpenAI有意狙擊Google。
先不論OpenAI擇日動機,此役已收奇襲之效,事關Google會上最大亮點「Project Astra」,竟與GPT-4o一樣是多模態助理,後者卻早一天「喝到頭啖湯」。
這正是科技圈亘古不變的現象。香港無線科技商會主席李勁華接受本刊訪問時用科技界典故「Browser wars(瀏覽器大戰)」類比目前形勢﹝圖二﹞,「以前瀏覽器市場各有千秋,直至Chrome成為絕對贏家,戰爭就完結」,那麼AI大戰會否同樣Winner takes all?歷史告訴我們:可能會。
無可避免的大戰
香港理工大學視覺計算講座教授陳長汶是視覺和多媒體通信領域傑出學者,獲頒電機電子工程學會會士、國際光電工程學會會士,9月出席在沙特阿拉伯舉辦的全球人工智能高峰會(Global AI Summit),是獲邀出席的貴賓中,唯一來自香港者。回港後接受本刊訪問,陳長汶說出他的感覺,「他們在搶driver's seat,也就是說誰可以領導下一波的革新(innovation)」,而這有一個相對實在的指標:AGI,簡單來說,就是鬥誰家的AI更接近人類。
但技術大戰正式開始之前,巨頭們要先打一場前哨戰:電力。
「草莓計劃」可慳電
「AI非常耗電。」陳長汶引述國際能源總署的兩年全球能源使用預測,該報告指出,數據中心、加密貨幣和AI相關領域的用電量到了2026年將達6200億度至1.5萬億度,相當於日本全國一年的用電量,陳長汶笑言,「我們的大腦一天只消耗25瓦電,神經元數卻比GPT-4參數量多上千倍」。
「現在單純做預訓練(Pre-Training)已經不夠電」。專注科技的易方資本投資組合經理王逸研解釋,有別於城市中的家用電,數據中心﹝圖三﹞內的GPU平日各司其職,將AI模型拆分成不同部分訓練,當其中一部分訓練完成,負責該部分的GPU就要「集合通訊」,告訴其他GPU今次的訓練成果,而這個過程中上萬張GPU會在數秒間同時啟動,「用電量會忽然飆高得很厲害」,此現象稱為「Elephant Flow」(大象流),「形同春運」。
因此,目前科技巨頭都在「搶電」,尤其是核電。今年3月,亞馬遜雲業務AWS跟能源公司Talen簽下直接供電協議,從後者手上買入一座靠近核電廠的核能數據中心園區,有傳微軟都曾有意競投;OpenAI執行長Sam Altman投資先進核能初創之餘,更大讚核電「是最佳解決方案」,也許已預示核能是下一兵家必爭之地。
然而,在開源(搶電)的戰場打得正酣之際,節流(省電)一端也有突破。
此場「AI大戰」的始作俑者OpenAI近日有新搞作──最新AI模型「Strawberry」(草莓)即將面世,不僅是史上首個,也有媒體稱之為「地表最強推理AI模型」,可以處理更高階數學題。
別看它來勢洶洶,原來極省GPU,王逸研解釋,「Strawberry包含後訓練(Post-Training)技術,即是『增強原來模型』,GPT-4不懂得計數,但GPT-4加草莓就識計數」,他續道,在GPT-5出現之前,Strawberry作為兩代旗艦產品的「中間版本」,「讓你可以在很節省GPU(後訓練只需動用數十至數百個GPU)的情況下,獲得一個邏輯、準度都強很多的模型」。
易方資本AI研發顧問王遨研進一步提出新趨勢,「之前(科企)不斷推大模型,但最近發現一些小型語言模型經過微調(Fine-Tuning)表現不遜大模型」。舉例ChatGPT-4o mini,能力跟GPT-4o相若,價格卻更相宜,其他開發商如Anthropic、Google、微軟都相繼推出自家小語言模型。
——節錄自10月號《信報財經月刊》